2020年一线城市天气数据分析
案例数据
案例数据下载:
案例数据说明
案例数据为2020年一线城市天气数据,字段说明如下:
字段 | 说明 |
---|---|
date | 日期 |
ceilTemp | 最高温 |
floorTemp | 最低温 |
weather | 天气 |
windOrient | 风向 |
area | 城市 |
airQuaRate | 空气质量 |
airQuaRank | 空气等级 |
windRank | 风力等级 |
案例目标
- 分析四个城市每个月的最高温和最低温的平均气温
- 分析四个城市一年中,每天的温度分布情况
- 分析四个城市一年中空气质量的分布情况
- 分析污染天气在季节上的分布规律
- 探寻“空气质量”的影响因素
- 对北京差天气的原因分析
1. 分析四个城市每个月的最高温和最低温的平均气温
-
分析:使用字段【date】,【area】,【ceilTemp】,【floorTemp】,使用折线图展示2020年1月到12月的最高温和最低温的平均气温趋势
-
字段【date】是字符串类型,需要使用计算字段转为日期类型:DATEPARSE([date],'yyyy-mm-dd')
-
标记改为“线”
-
将计算字段【日期】拖到列并按“月”拆分,将【ceilTemp】和【floorTemp】拖动到行并将其聚合方式改为平均
- 将【area】拖动到标记“颜色”
2. 分析四个城市一年中,每天的温度分布情况
-
分析:使用计算字段【日期】,字段【area】,【ceilTemp】,【floorTemp】,使用气泡图展示2020年每天的最高温和最低温的分布
-
将标记设为“圆”
-
将计算字段【日期】拖到列并按“日”拆分,将【ceilTemp】和【floorTemp】拖动到行并将其聚合方式改为平均
3. 分析四个城市一年中空气质量的分布情况
- 分析:使用计算字段【计数-空气质量】,字段【area】,【airQuaRank】,使用堆叠条图展示
- 创建计算字段【计数-空气质量】:COUNT([airQuaRank])
- 工作表右侧基本图表中选择堆叠条图
- 拖动字段
- 点击标记中的颜色,编辑颜色
4. 分析污染天气在季节上的分布规律
- 分析:使用计算字段【天数】,【日期】,字段【area】,【airQuaRank】,使用折线图展示趋势
- 创建计算字段【天数】:COUNT([date])
- 拖动字段,其中【日期】按“季度”拆分
- 使用筛选器,筛选空气质量中包含污染的数据
5. 探寻“空气质量”的影响因素
- 分析:使用计算字段【温差】,字段【windRank】,【area】,【airQuaRank】,使用折线图展示趋势
- 创建计算字段【温差】:[ceilTemp]-[floorTemp]
- 拖动字段
- 度量的聚合方式设置为平均
- 从结果分析原因:温差越大可能空气质量越好,风级越大可能空气质量越好
6. 对北京差天气的原因分析
-
分析:使用计算字段【温差】,字段【windRank】,【area】,【airQuaRank】,使用条形图比较
-
从结果分析:
- 虽然和空气质量相关性最高的是风力等级,但不是造成北京空气质量较差的主要原因
- 北京的空气质量较差是因为北京的最低温度和温差比上海、广州、深圳都要大很多
制作仪表盘
- 查看仪表盘
案例总结
本案例对天气数据进行分析,使用条形图、折线图、气泡图等进行可视化探索分析,使用筛选器和颜色设置,分析结果通过仪表盘进行展示。